查看原文
其他

人工智能如何才能从根本上改变药物发现

智药邦 智药邦 2022-06-15

人工智能在药物发现中的应用越来越多,但是否能从根本上改变药物发现,存在许多争论。

2021年12月14日, Nano Magazine发布了一篇文章,从药物发现面临的挑战出发,回顾了组合化学、计算机辅助药物设计等技术的发展,对目前在药物发现中应用人工智能面临的问题进行了分析,并探讨了采用整体方法的AI药物发现。

以下是全文内容。

前言

目前对疫苗和抗病毒药物的需求,以及持续的Covid-19大流行,使人们重新关注目前可用的治疗药物,以及我们为任何疾病发现和开发新药的速度。

这种关注进一步推动了以人工智能为中心的努力,以改善药物开发过程。与其他100多家专注于人工智能驱动方法的公司一样,谷歌的母公司Alphabet也成立了一家名为Isomorphic Labs的公司,在药物发现中利用深度学习。

利用人工智能解决药物发现中的挑战已经吸引了公司、投资者和公众的想象力。为此Nano Magazine汇编了一份关于药物发现和纳米医学领域如何转型的关键报告。

药物发现的挑战

药物发现的核心是寻找与我们体内的致病蛋白质结合的新型分子,无论是我们自己的蛋白质还是病毒或细菌的蛋白质。设计这些新的药物分子是一个纳米级的科学和技术挑战。典型的可作为药物服用的小分子药物需要10-12年才能进入市场,并需要数十亿美元的开发费用,每个项目的成功几率从20分之一到50分之一不等,这取决于治疗领域。这是一场高风险、高回报的竞争,每一次成功都伴随着几十次的失败。

大型制药公司研发的投资回报率现在有接近成本的趋势,而且预计会进一步下降。制药公司通过提高药物价格和从处于早期开发阶段的小公司那里获得有前途的药物的许可,来弥补这种日益低下的效率。越来越多的美国FDA批准的药物是被重新利用或me-too的药物,对改善各种疾病的治疗没有什么作用。如果说有什么行业的转型时机已经成熟,那就是制药行业。

几十年来,确定潜在的候选药物一直是一种自动化、机器驱动的试错方法,称为高通量筛选(HTS)。HTS通过检测与结合活性相关的实验信号,将致病蛋白与预先合成的类似药物的化合物储存在一个化学库中。显示出强烈信号的化合物(hits)被进一步定性和化学修饰,以期找到在动物研究中足够安全和有效的候选药物,以保证人体临床试验。

不幸的是,该行业目前的化合物库仅相当于潜在药物化合物浩瀚海洋中的一滴水;除非该行业找到一种方法来快速浏览它,否则整个药物发现过程仍将是耗时、昂贵和不稳定的,成功的几率很低。

我们需要系统地设计出能与任何感兴趣的蛋白质结合的新型药物。

寻求解决方案的悠久历史

人工智能只是在过去30年里为简化药物发现而进行的几次尝试中的最新尝试。在20世纪90年代,组合化学领域已经成熟,并有望迅速建立预先合成的化合物库,通过HTS进行测试。

组合化学吸引了投资者的想象力,也吸引了他们的大量资金,但组合化学只对现有的化学结构进行小幅修改,并没有产生根本性的新分子。在扩大行业化合物库的最初进展之后,它出现了动摇,既没有实现预期的研发节约,也没有实现管线的蓬勃发展,因此大多数使用这种方法的公司都倒闭了。

于是美国医药科学家协会药物设计和发现主席Peter Crooks博士评论说:"组合化学的承诺并没有像预期的那样发展,我们没有看到开发中的新药的巨大增长。"

在同一个十年里,Vertex制药公司是系统化计算机驱动药物设计的早期倡导者。它的目标是用药物-蛋白质相互作用的计算机模拟(基于物理学和化学基本规律),来取代使用化合物(预先合成的)的HTS实验室测试。如果不用合成就能测试分子,那么就可以用比HTS更少的时间和成本来测试大量的潜在候选药物。

不幸的是,当时的科学、技术和计算机资源无法与理论相匹配,因此Vertex整合了传统的试错的实验室方法,并将其重新命名为"化学基因组学",以推动少数候选药物进入临床试验。

许多同时代的公司,如最初的Locus Pharmaceuticals和Pharmix,后来都消失了,而一些公司,如Schrödinger,进化了他们的工具集还有一些公司,如Verseon,在过去20年中出现了。

药物发现中的人工智能面临的挑战

一系列的纯人工智能公司现在旨在通过将所有可用的制药实验室数据和公开的数据,输入他们的预测性人工智能算法,来"解决"药物发现问题,这引起了三个基本问题。

首先,人工智能被困在已知的数据边界内,著名的人工智能研究员和Edammo公司的首席技术官Amaury Lendasse指出,"人工智能技术从已知的数据中学习,可以在这个特定数据所在的领域内进行预测。换句话说,它们是插值(interpolate)。它们不具备在该领域之外表现良好的能力,而且往往不能很好地推断。"

其次,在药物发现中使用人工智能需要两种不同的数据集来进行良好的预测(或任何预测)。一组是已知的对类似场景有效(起作用)的解决方案,即以前合成的化合物的数据。另一个数据集,是不起作用的数据集,它根本不以任何有意义的形式存在于公布的生物科学文献中。

第三,大多数生命科学研究的结果是不可重复的(即使是保守的估计也超过了50%)。如果大多数公布的研究数据是不可重复的,任何基于这些数据的人工智能预测都是非常可疑的。

一些新进入者炒作纯粹基于人工智能的药物发现

那么,人工智能药物发现公司的投资者是否陷入了与组合化学和早期计算机辅助药物设计同样的炒作中?

一家备受瞩目的公司,BenevolentAI,近年来获得了超过3.45亿美元的资金。它推销自己的"生物科学机器大脑"和"知识图谱"技术,其中包含了期刊文章、实验室数据、网络生物学、药物项目数据、专利文献和临床数据。但没有提供任何技术细节,许多研究人员认为"知识图谱"是对狂妄主张的简单化表述。

杰出的药物化学家Derek Lowe在他2018年的science.org文章 "BenevolentAI: Worth Two Billion?"中,谴责了围绕AI药物发现的"炒作"。他自己对人工智能的期望更有分寸:"人工智能将非常善于挖掘我们已经发现的东西,但我们对细胞、生物体和疾病的了解还不够,无法为人工智能提供足够的数据集来进行分析。"

至于关于生物科学机器大脑的新闻稿,Lowe说,"我希望说服人们拿出1.15亿美元的PPT文件写得没有这篇新闻稿那么令人瞠目结舌。"

另一家宣称只采用人工智能方法的公司是Exscientia,该公司最近上市,筹集了5亿多美元。它有几个候选药物进入I期临床试验,但这些化合物似乎不是真正的新型化学物质。例如,国际搜索报告(ISR)显示,该公司的抗癌A2受体拮抗剂的基础化学骨架,以及其他几个高度相似的骨架,在几年前就已经由其他人发表了。ISR继续指出,除了一个Exscientia公司对这种药物的专利申请外,所有的专利都是 "非创造性的"。这似乎也是其其他候选药物的一个共同问题。

Trotana Therapeutics公司的药物发现主管Craig Coburn评估了关于Exscientia公司的强迫症、免疫肿瘤学和阿尔茨海默氏症相关的候选药物的公开信息,并得出结论:

"在每一个例子中,临床化合物的结构都与现有技术非常接近,并对已知的化学类型进行了修改,以改善某些缺陷,如溶解度,或为了专利,目的是建立一个狭窄的新知识产权范围。这些项目中的每一个都没有提供比有经验的药物化学家更多的洞察力和设计。Exscientia的'平台'也许更应该被描述为一种半自动化的方式,通过药物化学空间的特征良好的部分来寻找可申请专利的化学物质。"

检查Exscientia网站上发布的论文也能提供关于它是否取得了根本性进展的线索。一篇专题论文涉及细胞成像分析,以计算从活体组织中提取的癌细胞的比例。Exscientia称这为 "单细胞功能精准医学"(scFPM),但一些专家说这与普通的流式细胞术没有什么区别,随后用简单的机器学习技术来分析产生的一组标准输出。

另一篇论文讨论了"TrendyGenes",它可以归结为一种自动计算基因名称出现与发表时间的方法。一个特定基因的论文发表活动的爆发被解释为值得进一步研究的可能的突破。但这种技术使用的是标准的机器学习技术,研究的是目标蛋白,而不是新药。

Alphabet推出了上述的Isomorphic实验室,以"用AI优先的方法重新想象开发新药的过程"。此前,另一家子公司DeepMind在2020年展示了准确预测蛋白质如何折叠的能力。

"深度学习"是DeepMind核心的机器学习技术,自20世纪80年代开发出第一个神经网络以来,已经取得了重大进展。它现在在下棋和围棋以及图像识别方面表现出色。

然而,一些定义明确的规则和大量可用或可生成的数据是这些环境的特征,而蛋白质折叠是一个具有类似特征的问题。各种进化规则制约着蛋白质如何获得其最终的形状,从而在生物环境中变得有用。近几十年来人们还收集了大量关于蛋白质结构的实验数据,以及蛋白质在其基本组成氨基酸序列发生微小变化后表现出的结构变化。所有这些信息为既定的深度学习技术的应用创造了完美的环境。

相比之下,药物发现是一个真正不同的环境。关于蛋白质和药物结合的现有数据非常稀少,而且往往不可靠。与化学空间未开发部分的大量潜在类药物化合物相比,只有极少数的化合物已经被合成,并且存在与蛋白质结合的数据。上面讨论的不可复制性问题意味着这些化合物的许多数据与它们的一些生物效应有关也是不可靠的。另一个复杂的问题是,药物分子的微小变化,会对它们与蛋白质的结合亲和力以及它们的其他生物特性产生巨大影响。这种情况不适合大多数现有的机器学习技术,特别是深度学习。

正如新加坡南洋理工大学教授、谷歌学者经典人工智能论文前两名的主要作者Guang-Bin Huang说,"尽管深度学习在某些领域取得了成功,但在许多情况下,它不是最佳解决方案。特别是对于小型或稀疏的数据集,其学习能力和预测性能相当有限"。

然而,DeepMind和Isomorphic实验室的首席执行官Demis Hassabis断言,"生物学和信息科学之间可能有一个共同的基本结构--两者之间的同构映射,就像数学变成了物理学的正确描述语言一样,生物学可能变成了应用AI的完美类型" 。但这种说法招致了熟悉新药发现的专家们的大量怀疑(药物发现不那么整齐、更开放)。

事实上,这些公司对旧技术进行了切身的修改的大胆的宣称和新的营销术语,表明许多以人工智能为中心的药物发现公司正在追随Vertex和其他老公司的脚步。希望有些公司能对药物发现的各个方面进行逐步改进,也许能推进一些候选药物,但目前没有迹象表明它们会从根本上改变这一过程。

采用整体方法的公司

因此,如果纯粹的以人工智能为中心的方法不太可能解决药物发现的基本问题,那么实际上需要什么来设计从未合成过的化合物,并准确模拟它们与致病蛋白质的相互作用,而不需要先在实验室里制造它们?

现在的答案是:人工智能与原子级化学和物理学的进展相结合。

自1990年以来,Schrödinger一直在这个领域,销售用于计算机驱动的药物发现的软件工具,其中包括有限的基于物理的建模,以特定情况的实验数据驱动的近似值为辅助。受最近流行的影响,该公司最终将这套工具打上了"人工智能"的标签,并继续增加其他组件。在过去的二十年里,大多数制药和生物技术公司都使用了Schrödinger和其他公司的工具,尽管该行业研发生产力的下降趋势表明,这种工具在目前的状态下无法改变药物发现。

虽然Schrödinger的工具不是革命性的,但它们可以说对药物发现过程是有用的。该公司于2020年上市,为最近的内部药物项目提供资金,虽然到目前为止没有一个项目推进到临床试验,但Schrödinger的研发生产力并不比目前任何其他传统或以人工智能为中心的制药公司差,而且鉴于其对自身工具的深入理解,可能更好。 

与此同时,Verseon拥有一个与传统制药或纯人工智能公司不同的药物发现平台。虽然这个相对较新的公司在人工智能成为一个时髦的流行语之前,早就建立并使用自己的人工智能工具进行部分药物开发,但该公司已经避免了人工智能的炒作。相反,Verseon的立场是,许多不同科学领域的根本性进展对于推动新型候选药物的快速系统设计和开发是必要的。尽管Verseon热衷于保护其商业机密,但该公司将其平台提供给来自工业界和学术界值得信赖的知名人士。

基于他对该平台的分析和测试,辉瑞公司前研发战略高级副总裁Robert Karr继续对Verseon进行投资,他说,"其他所有人都只是在系统性药物发现领域涉足了一点,Verseon的颠覆性平台改变了药物的发现和开发方式,该公司准备对现代医学产生巨大的影响"

几年来,Verseon公司的方法在各个疾病领域积累了证据,它目前有14个处于不同开发阶段的新型候选药物。

每个项目都有多个化学性质不同的临床候选药物,这是制药业闻所未闻的壮举。Verseon公司的药物不仅包括不太可能通过任何其他方法找到的新型化学结构(像Karr这样的专家声称的),而且还拥有独特的特性,代表着他们计划治疗的医疗条件与目前的护理标准有了积极的区别。Verseon的抗凝血剂项目目前正在进行临床试验,UCL心脏病学教授John Deanfield说,"Verseon的血小板疏通抗凝剂具有独特的作用方式和低出血风险,看起来非常有前途。他们的药物代表了一个令人兴奋的'精准医疗'机会,可以治疗大量的心血管疾病患者。"

在伦敦AIM(另类投资市场)短暂上市后,回到美国似乎是不幸中的万幸,因为Verseon近年来将其平台和早期候选药物管线推向了新的高度。

结语

人工智能可以成为协助药物发现过程的重要工具,但最成功的公司将是那些完全掌握药物发现的巨大复杂性,并开发工具以应对所有方面挑战的公司。

许多其他行业已经见证了探索新方法的公司所带来的欣喜和投机性投资。大多数都失败了,但有时会有一两家公司出现,从根本上改变现状;我们可能即将在药物发现领域看到这一点,这将对全球健康产生真正的影响。

参考资料

https://nano-magazine.com/news/2021/12/9/can-ai-fundamentally-transform-drug-discovery-and-nanomedicine-e59p6-lw5n6


----------- End -----------



感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或

姓名-学校-职务/研究方向




- 历史文章推荐 -


产业进展

●Drug Discov Today|MD安德森癌症中心:利用AI增强临床前药物发现

如何管理人工智能和数据科学:来自诺华的实践经验和教训

●Drug Discov Today|药物研发风险地图

AI药物发现公司继续寻求最佳商业模式

20家顶尖制药公司如何将AI应用于药物研发:近年来主要合作活动


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存